#pragma once
#include <torch/torch.h>
#include <cuda_fp16.h>

torch::Tensor cuda_add(torch::Tensor a, torch::Tensor b);